Ha главную страницу третьего семестра

Реконструкция филогенетического дерева с помощью 4-х разных методов.

Структура исходного дерева

Mатрица попарных расстояний, выданная программой
ednadist

Мутантные последовательности А B C D E F
A 0,00 0,2847 1,5645 1,5386 1,4776 1,3197
B 0,2847 0,00 1,4322 1,3687 1,4322 1,3998
C 1,5645 1,4322 0,0000 0,3842 0,8240 0,8046
D 1,5386 1,3687 0,3842 0,0000 0,7998 0,7405
E 1,4776 1,4322 0,8240 0,7998 0,0000 0,6193
F 1,3197 1,3998 0,8046 0,7405 0,6193 0,0000

Структуры, предложенные программами
eneighbor,ednaml и ednapars .


Метод UPGMA программы
eneighbor .

 

                                     +-------A
  +----------------------------------1  
  !                                  +-------B
  !  
--5                               +----------C
  !                  +------------2  
  !                  !            +----------D
  +------------------4  
                     !     +-----------------E
                     +-----3  
                           +-----------------F

UGPMA восстанавливает ультраметрическое, укорененное дерево. Полученное дерево полностью соответствует исходному.Алгоритм использует матрицу расстояний.
Скобочная формула, соответствующая данному дереву. ((A:0.14235,B:0.14235):0.57848,((C:0.19210,D:0.19210):0.20401,(E:0.30965,F:0.30965):0.08646):0.32472);

Метод ближайших соседей (Neighbor-Joining) программы
eneighbor

  +----------e
  !  
--4--------f
  !  
  !                             +-----a
  !  +--------------------------1  
  !  !                          +---b
  +--3  
     !      +------c
     +------2  
            +-----d
Данный алгоритм также как и предыдущий, является эвристическим.Метод использует матрицу расстояний.Полученное с его помощью дерево является неукорененным.
Скобочная формула, соответствующая данному дереву: (E:0.34327,F:0.27602,((A:0.17579,B:0.10891):0.90320,(C:0.21427,D:0.16993):0.23835):0.05212);

Метод наибольшего правдоподобия (Maximum Likelihood) программы
ednaml

  +--b         
  !  
  !                            +-----f         
--1----------------------------4  
  !                            !  +------e         
  !                            +--3  
  !                               !     +---d         
  !                               +-----2  
  !                                     +---c         
  !  
  +--a         
Данное дерево является неукорененным. Оно полученно переборным алгоритмом, использующим критерий качества - максимальную схожесть. Это символьно-ориентированный метод.
Скобочная формула, соответствующая данному дереву: (B:0.16441,(F:0.31344,(E:0.35703,(D:0.19434,C:0.21708):0.32635):0.03381):1.42881, A:0.14582);

Метод максимальной экономии (Parsimony) программы
ednapars .

        +--------f         
     +--5  
     !  !  +-----e         
     !  +--4  
  +--2     !  +--d         
  !  !     +--3  
  !  !        +--c         
--1  !  
  !  +-----------b         
  !  
  +--------------a 
Данное дерево является неукорененным, полученно переборным алгоритмом. Используемый метод является символьно-ориентированным. Заметим, что данный алгоритм не отражает длинну ветвей, причем в данном случае программа не создавала скобочную формулу, и она была сделана вручную.
Скобочная формула, соответствующая данному дереву: (((((C,D),E),F),B),A)

Cравнение топологии исходного филогенетического дерева модели и 4-х вариантов его реконструкции

Ветвь Исходное дерево
модели
UPGMA NJ ML Parsimony
ABCDEF
110000 + + + + +
001100 + + + + +
111100 + + +
110001 + +
Как видно из таблицы, идентичное по топологии дерево создали оба эвристических алгоритма.Заметим также, что исходное дерево было ультраметрическим, и метод UPGMA правильно укоренил дерево, т.е. полностью воссоздал исходное дерево. Полученный результат несколько удивляет, так как в общем переборные алгоритмы отличаются большей эффективностью чем эвристические, хотя имеют намного меньшую скорость работы.Можно предположить причины получения таких результатов: расстояние между последовательностями узлов 3 и 4 равно 10, т.е. очень незначительно, при этом расстояние между F и E значительно больше, при этом последовательность F очевидно ближе к А и BE - к С и D, поэтому переборные алгоритмы проигнорировали "маленькую" ветвь.

© Yuminova Alina aka Melli, 2005